Preparación y limpieza de datos

Análisis descriptivo

Estadísticas descriptivas de las variables principales

Tabla 1: Estadísticas Descriptivas de las Variables Principales del Dataset de Préstamos
Variable Media Mediana Desv. Estándar Mínimo Máximo
ingreso 73988.51725 65000.0 39179.951858 1896 250000.0
relacion_deuda_ingreso 18.44388 17.9 8.551767 0 50.0
monto_prestamo 14360.01281 12000.0 8644.572488 500 40000.0
puntaje_fico 697.46601 692.0 31.701742 612 847.5
Nota: Fuente: Elaboración propia con base en el dataset Lending Club (2007–2018). Muestra: 20,000 observaciones.

Distribución de frecuencias por estado de pago

Tabla 2: Distribución de Frecuencias por Estado de Pago
Estado Pago Frecuencia Porcentaje (%)
Paga 812629 79.89
No_paga 204551 20.11
Nota: Fuente: Elaboración propia con base en el dataset Lending Club (2007–2018). Muestra: 20,000 observaciones.

Distribución individual de variables numéricas

Histograma del ingreso

Distribución de la relación deuda/ingreso

Distribución del puntaje FICO

Distribución del monto del préstamo

Variable por estado de pago

Puntaje FICO por estado de pago

ingreso por estado de pago

Comparación de variables numéricas según estado de pago

Relaciónes

Relación entre puntaje FICO y relación deuda/ingreso

Relación entre ingreso y monto del préstamo

Relación entre puntaje FICO y relación deuda/ingreso

Tasas

Tasa de default por decil de ingreso

Tasa de Default e Indicadores por Propósito del Préstamo

Tabla 3: Tasa de Default e Indicadores por Propósito del Préstamo
Propósito Tasa No Paga Ingreso Mediano FICO Mediano
Casa_Vehiculo 0.181 70000 697
Consolidacion 0.201 65000 687
Negocio_Estudio 0.297 75000 692
Otros 0.212 60000 692
Nota: Fuente: Elaboración propia con base en el dataset Lending Club (2007–2018). Muestra: 20,000 observaciones.

Propósito

Distribución del puntaje FICO por propósito y estado de pago

Correlacion

Matriz de correlaciones entre variables numéricas